ZPedia|李飞飞2篇长文点破本质,当前AI对空间的理解完全跑偏,Marble或是未来5年最重要的AI产品
昨天,李飞飞的 World Labs 团队正式发布了首款产品——Marble,一个真正意义上面向大众的多模态世界模型平台。用户只需要一张图、一段视频,甚至一句短短的文字,就能在浏览器里生成一个可漫游、可编辑、可导出的三维世界。不需要 Blender,不需要虚幻
昨天,李飞飞的 World Labs 团队正式发布了首款产品——Marble,一个真正意义上面向大众的多模态世界模型平台。用户只需要一张图、一段视频,甚至一句短短的文字,就能在浏览器里生成一个可漫游、可编辑、可导出的三维世界。不需要 Blender,不需要虚幻
生成文字靠语言模型,生成图像靠扩散模型,但要从一张二维图片“复原”出一个真实存在于空间的物体,却远比想象中复杂。它要求模型不仅能理解形状,还要理解尺度、光照、材质与物理属性——也就是让算法,不只是“看见”,而是“构建”一个世界。